The task of image segmentation is to classify each pixel in the image based on the appropriate label. Various deep learning approaches have been proposed for image segmentation that offers high accuracy and deep architecture. However, the deep learning technique uses a pixel-wise loss function for the training process. Using pixel-wise loss neglected the pixel neighbor relationships in the network learning process. The neighboring relationship of the pixels is essential information in the image. Utilizing neighboring pixel information provides an advantage over using only pixel-to-pixel information. This study presents regularizers to give the pixel neighbor relationship information to the learning process. The regularizers are constructed by the graph theory approach and topology approach: By graph theory approach, graph Laplacian is used to utilize the smoothness of segmented images based on output images and ground-truth images. By topology approach, Euler characteristic is used to identify and minimize the number of isolated objects on segmented images. Experiments show that our scheme successfully captures pixel neighbor relations and improves the performance of the convolutional neural network better than the baseline without a regularization term.
translated by 谷歌翻译
The deep learning technique was used to increase the performance of single image super-resolution (SISR). However, most existing CNN-based SISR approaches primarily focus on establishing deeper or larger networks to extract more significant high-level features. Usually, the pixel-level loss between the target high-resolution image and the estimated image is used, but the neighbor relations between pixels in the image are seldom used. On the other hand, according to observations, a pixel's neighbor relationship contains rich information about the spatial structure, local context, and structural knowledge. Based on this fact, in this paper, we utilize pixel's neighbor relationships in a different perspective, and we propose the differences of neighboring pixels to regularize the CNN by constructing a graph from the estimated image and the ground-truth image. The proposed method outperforms the state-of-the-art methods in terms of quantitative and qualitative evaluation of the benchmark datasets. Keywords: Super-resolution, Convolutional Neural Networks, Deep Learning
translated by 谷歌翻译
网络体系结构搜索(NAS)已成为开发和发现针对不同目标平台和目的的新神经体系结构的常见方法。但是,扫描搜索空间由许多候选体系结构的长期培训过程组成,这在计算资源和时间方面是昂贵的。回归算法是预测候选体系结构准确性的常见工具,可以极大地加速搜索过程。我们旨在提出一个新的基准,该基线将支持回归算法的开发,该算法可以通过其计划来预测建筑的准确性,或者仅通过对其进行训练以最少的时代进行训练。因此,我们介绍了440个神经体系结构的NAAP-440数据集,这些数据集使用固定配方在CIFAR10进行培训。我们的实验表明,通过使用现成的回归算法并运行多达10%的培训过程,不仅可以准确地预测体系结构的准确性,而且还可以预测架构预测的值,还可以保持其准确性顺序违反单调性的数量最少。这种方法可以作为加速基于NAS的研究的强大工具,从而大大提高其效率。研究中使用的数据集和代码已公开。
translated by 谷歌翻译
高通量测序技术的最新进展使得可以提取多个特征,这些特征描绘了以不同和互补分子水平的患者样本。此类数据的产生导致了计算生物学方面的新挑战,这些挑战涉及捕获多个基因及其功能之间相互关系的高维和异质数据集的整合。由于它们的多功能性和学习复杂数据的合成潜在表示的能力,深度学习方法为整合多词数据提供了有希望的观点。这些方法导致了许多主要基于自动编码器模型的许多原始体系结构的概念。但是,由于任务的困难,集成策略是基本的,而不是失去全球趋势而充分利用来源的特殊性。本文提出了一种新型策略,以构建可自定义的自动编码器模型,该模型适应高维多源集成而言使用的数据集。我们将评估整合策略对潜在代表的影响,并结合提出一种新方法的最佳策略(https://github.com/hakimbenkirane/customics)。我们在这里关注来自多个OMIC来源的数据的集成,并证明了针对多个任务(例如分类和生存分析)的测试用例的拟议方法的性能。
translated by 谷歌翻译
本文的目的是纠正对卷积神经网络(CNN)的误解。CNN由卷积层组成,由于重量共享,这些卷积层是偏移的。但是,与普遍的看法相反,即使忽略边界效应以及汇集和亚采样不存在,卷积层也不是翻译等效的。这是因为移位均值是一种离散的对称性,而翻译等效性是连续的对称性。这种离散的系统一般不会继承持续的等效性是对模棱两可的深度学习的基本限制。我们讨论了这一事实的两个含义。首先,尽管没有继承其模型的物理系统的翻译等效性,但CNN在图像处理方面取得了成功。其次,使用CNN求解偏微分方程(PDE)不会导致翻译模化求解器。
translated by 谷歌翻译
The-Internet(IoT)网络智能地连接了数千个物理实体,为社区提供各种服务。它目睹了指数扩展,这使发现网络中存在的IoT设备并请求相应的服务的过程变得复杂。随着物联网环境的高度动态性质阻碍了传统的服务发现解决方案的使用,我们在本文中,通过提出一个可扩展的资源分配神经模型来解决此问题,足以适合异构的大型IoT网络。我们设计了一种图形神经网络(GNN)方法,该方法利用IoT网络中设备之间形成的社会关系来减少任何实体查找的搜索空间,并从网络中的另一个设备中获取服务。这种提出的资源分配方法超过了标准化问题,并通过GNNS的方式嵌入了社会物联网图的结构和特征,以最终的聚类分析过程。对现实世界数据集的仿真结果说明了该解决方案的性能及其在大规模IoT网络上运行的显着效率。
translated by 谷歌翻译
6G将移动移动网络以增加复杂程度。为了处理这种复杂性,网络参数的优化是确保高性能和及时适应动态网络环境的关键。天线倾斜的优化提供了一种实用且具有成本效益的方法,以提高网络中的覆盖率和容量。通过学习自适应策略优于传统的倾斜优化方法,基于强化学习(RL)的先前方法对倾斜优化具有很大的通知。但是,大多数现有的RL方法都基于单个小区特征表示,它无法完全表征代理状态,从而导致次优的性能。此外,由于国家行动爆炸和泛化能力,大多数此类方法缺乏可扩展性。在本文中,我们提出了一个关于倾斜优化的Q-Learnal(GaQ)算法的图表。 GaQ依赖于图形注意机制来选择相关的邻居信息,提高代理状态表示,并根据使用深Q-Network(DQN)的观察历史更新倾斜控制策略。我们表明GAQ有效地捕获重要的网络信息,并通过大边距与本地信息优于标准DQN。此外,我们展示了概括到不同尺寸和密度的网络部署的能力。
translated by 谷歌翻译
卷积神经网络(CNN)的泛化性能受训练图像的数量,质量和品种的影响。必须注释训练图像,这是耗时和昂贵的。我们工作的目标是减少培训CNN所需的注释图像的数量,同时保持其性能。我们假设通过确保该组训练图像包含大部分难以分类的图像,可以更快地提高CNN的性能。我们的研究目的是使用活动学习方法测试这个假设,可以自动选择难以分类的图像。我们开发了一种基于掩模区域的CNN(掩模R-CNN)的主动学习方法,并命名此方法Maskal。 Maskal涉及掩模R-CNN的迭代训练,之后培训的模型用于选择一组未标记的图像,该模型是不确定的。然后将所选择的图像注释并用于恢复掩模R-CNN,并且重复这一点用于许多采样迭代。在我们的研究中,掩模R-CNN培训由由12个采样迭代选择的2500个硬花甘蓝图像,从训练组14,000个硬花甘蓝图像的训练组中选择了12个采样迭代。对于所有采样迭代,Maskal比随机采样显着更好。此外,在抽样900图像之后,屏蔽具有相同的性能,随着随机抽样在2300张图像之后。与在整个培训集(14,000张图片)上培训的面具R-CNN模型相比,Maskal达到其性能的93.9%,其培训数据的17.9%。随机抽样占其性能的81.9%,占其培训数据的16.4%。我们得出结论,通过使用屏马,可以减少注释工作对于在西兰花的数据集上训练掩模R-CNN。我们的软件可在https://github.com/pieterblok/maskal上找到。
translated by 谷歌翻译
知识图形问题应答(kgqa)涉及使用自然语言查询从知识图(kg)中检索事实。 KG是由关系相关的实体组成的策划事实集。某些事实还包括形成时间kg(tkg)的时间信息。虽然许多自然问题涉及显式或隐含的时间限制,但TKGS上的问题应答(QA)是一个相对未开发的地区。现有解决方案主要是为简单的时间问题设计,可以通过单个TKG事实直接回答。本文提出了一种全面的嵌入式框架,用于回答TKGS的复杂问题。我们的方法被称为时间问题推理(TempoQR)利用TKG Embeddings将问题与其指的特定实体和时间范围进行地面。它通过使用三个专用模块增强与上下文,实体和时空信息的问题嵌入问题。第一个计算给定问题的文本表示,第二个将其与所涉及的实体的实体嵌入物组合,第三个生成特定于特定于问题的时间嵌入。最后,基于变换器的编码器学习用问题表示来融合生成的时间信息,该问题表示用于答案预测。广泛的实验表明,TempoQR在最先进的方法上通过25-45个百分点提高了25--45个百分点,并且它将更好地概括到未经说明的问题类型。
translated by 谷歌翻译
视网膜疗法代表一组视网膜疾病,如果不及时治疗,可能会导致严重的视觉障碍甚至失明。许多研究人员已经开发了自治系统,通过眼底和光学相干断层扫描(OCT)图像识别视网膜病变。然而,大多数这些框架采用传统的转移学习和微调方法,需要一种非常良好的注释训练数据来产生准确的诊断性能。本文提出了一种新型增量跨域适应仪,可以通过几次拍摄培训允许任何深度分类模型逐步学习OCT和眼底图像的异常视网膜病理。此外,与其竞争对手不同,所提出的仪器通过贝叶斯多目标函数驱动,不仅执行候选分类网络,不仅在增量培训期间保留其先前学到的知识,而且还确保网络了解先前学习的结构和语义关系病理学和新增的疾病类别在推理阶段有效地识别它们。所提出的框架,在用三种不同的扫描仪获得的六个公共数据集中评估,以筛选十三个视网膜病理,优于最先进的竞争对手,通过分别实现了0.9826和0.9846的整体准确性和F1得分。
translated by 谷歌翻译